SLO

Source:📖 電子書/SRE

SLO

服務水準目標 ( Service-Level Objective)

測量SLI後我們要替系統可用性設定一個更精確的目標,重點是與一段時間作掛勾衡量``期望狀態、目標範圍。

SLO由 SLI、一段時間區間、目標(通常用百分比呈現) 99.99%請求在300ms內,百分比越高要花費的成本就越高。

有這類指標才可以針對判斷 服務變得可靠(增加成本並拉長開發時程)或降低可靠性(容許更快的開發速度)

以 Google Cloud 來說,Google Cloud 對某些服務會實施定期停機,以防止服務的可用性過度。您也可以嘗試對前端伺服器實施間歇性、有計劃的停機,如同我們對我們其中一個內部系統所做的。這樣的作法,可能幫您找出伺服器使用不恰當的服務。有了這些資訊,您就可以將工作負載,移到更合適的位置,並且將伺服器保持在正確的可用性水準。

📖 電子書/resource/SRE.png
google針對 SLO Creating an SLO  |  Operations Suite  |  Google Cloud 或指南
Learn how to set SLOs -- SRE tips | Google Cloud Blog

SRE 必修課:一次搞懂 SLI、SLO、SLA 差異,Google DevOps 理念實踐 - iKala Cloud